共计 1036 个字符,预计需要花费 3 分钟才能阅读完成。
无论你做视频、播客,还是纯粹的文字内容创作,都可能会遇到需要视频 / 语音生成字幕的问题。
目前公认的比较好用的免费的开源离线工具,是 OpenAI 的 Whisper。
Whisper 使用起来还要代码,在这基础上,又有诸多改进和套壳,其中的佼佼者大概是 FasterWhisper。
但现实使用起来,还是需要下载离线模型,以及出现各种报错。
所以今天的主题是一个相对来说更方便,整合了更多工具的视频字幕处理助手——VideoCaptioner。
中文名叫卡卡字幕助手,操作简单且无需高配置,支持网络调用和本地离线(支持调用 GPU)两种方式进行语音识别,通过大语言模型进行字幕智能断句、校正、翻译,字幕视频全流程一键处理!
卡卡字幕助手比较厉害的点是它是可以一键下载 Youtube 视频,完成字幕生成、翻译、合成视频的,属于是视频搬运号的福音了。
在首页粘贴 Youtube 的视频链接就可以,但这些流程中难免会有出错 / 要对字幕校正的情况,所以我不会这么做。
我主要会使用它来生成字幕,如果你有 Cursor 的话,字幕翻译 / 校正可以使 用 Cursor 来做,准确率大大提高。
Ctrl + K 参考提示词:
请对以下字幕文本可能存在错误的地方进行校正【,并将英文翻译成中文】(框内提示词需要翻译时使用)
所以我会把这两个关掉,后续视频剪辑和合成在 Premiere 中处理。
正文完